Introducción al Tidyverse

R Ladies Chile

Camila Molina & Natalia Riquelme

¿Qué son los datos Tidy?

Los datos Tidy (ordenados) tienen como mínimo las siguientes propiedades:

  • Cada variable tiene su propia columna.
  • Cada observación de esa variable debe estar en su propia fila.

¿Por qué necesitamos datos ordenados?

Se nos hará más sencillo:

  • Manipular los datos y crear nuestros resúmenes.
  • Unir bases de datos ordenados entre si.
  • Visualizar nuestros datos.
  • Modelar.

A tener en cuenta: Mucho del trabajo que hagamos al analizar nuestros datos se tratará de limpieza.

Tidyverse

Tidyverse es una colección de paquetes disponibles en R y orientados a la manipulación, importación, exploración y visualización de datos. Se compone de varios paquetes, como:

  • readr
  • dplyr
  • ggplot2
  • tibble
  • tidyr
  • purr
  • stringr
  • forcats

Ahora, manos a la obra:

https://posit.cloud/content/5960904